拜登选前民调大幅领先 为何当选过程惊心动魄 影响民调的因素到底有哪些
参考:Martechcareer《美国大选民意调查到底是怎么做的?》、
英国报姐《突发!!川普输了!拜登赢得美国大选》
假装在纽约《拜登还有希望!美国大选的几个没有想到》
北京时间周日凌晨零点30分,CNN突然宣布:拜登赢得美国大选,成为第46任总统!
但其过程之跌宕起伏,已经让它变得像综艺选秀一样刺激。选前各大媒体普遍预测拜登将会轻松获胜,很多人带着这样的期待看选战结果,但却很快发现实际结果并不是这么一回事。
之前多项民调显示,拜登的得票率平均比川普高8%,在14个关键州里,拜登占优势的州也远多于川普。(从左至右:2016年民调→2016年实际结果→2020年民调)
因为数据太好看,不少人预测拜登的总统之路将走得又快又轻松。以佛罗里达为例,在多个民调结果中,拜登的得票率都高于川普,有的高6.1%,更夸张一点的,还有高9%……只要拿下佛罗里达、爱荷华、宾夕法尼亚那几个关键州,就可以送川普回老家了!
所以,当天开始点票之后,所有人目光都注意到了佛罗里达,随着点票不断进行,拜登团队,有点坐不住了......在佛罗里达,川普票数超越拜登,虽然差距不大。但是跟之前民调里的一边倒相比,完全两样。
几小时后,尘埃落定,川普再次赢得佛罗里达,成绩比2016年还好,赢了拜登3.4%。
另外一个民调打脸的就是爱荷华州,爱荷华州是美国平均受教育程度最高的州之一,90%的爱荷华人都有大学文凭。
这样的州是很受民主党人喜爱的,2016年失败后,他们在这里好一番耕耘,成功将2020的民调变得对民主党有利。民调中,拜登的得票率比川普高1.4%,现实中,拜登输给川普8.2%,川普赢下爱荷华。
那么,
总统总统大选民意调查到底是怎么做的?
什么是民调中的社会期许偏差?
到底是什么原因解释了民意调查经常“失准” ?
大选民意调查,说白了就是一种问卷调查方法, 但它又有特殊之处:要在美国全国人民中抽样调查,跨越所有种族、年龄段、性别、宗教 、党派、肤色,然后由这个抽样结果来推算出更大范围的人们将如何投票,最后按照总统大选的计票规则(各州独立计算、过半方赢者通吃)来计算出哪位候选人将获胜。在这个过程中的每一步都问题重重、没那么简单。
在30年前,互联网没有现在如此普及,也没有caller ID这种东西。在当时,民意调查是用电话调查进行的。一份全国性的抽样需要800个有效回答者,这往往意味着2000-2500通电话需要拨出(回答率大概在40%左右)。而今天,同样800份有效问卷,则需要拨出7500-9000通电话(回答率低于10%)。越来越低的回答率意味着样本不一定客观代表了你想要调查的人群总体。
实际上,如果你可以做到真正的随机抽样,那么800人足以推算出全美的民意了。想象一下:一部分美国人会去投票给特朗普,我们虽然无法观测到总体的值,但我们可以通过一小群人去估算出投票给特朗普的人占总体投票人数的比例。但问题在于,这个“一小群人”是否是真正随机抽样选出来的?
因此,低回答率还不是最大的问题,只要接电话的人和不接电话的人没有系统性差别。什么是系统性差别呢?
2012年总统大选年时,奥巴马在他和罗姆尼的第一轮总统辩论中表现极其糟糕,在这场辩论后,民主派选民变得不太愿意接受民意调查,因为他们不想讨论政治,而共和派选民就非常愿意接受民意调查。于是,民意调查结果就向罗姆尼发生了倾斜,可是他的实际支持率却并没有上升,最后结果是奥巴马打败了罗姆尼获得连任。这就是样本误差导致的调查结果失准。
为了纠正这种样本上的偏差,可以用加权的方法。比如,最简单的加权就是:如果样本里只有6%的参与者是非裔美国人,但是全美有12%非裔美国人,那么我们就可以用加权的方法,也就是在调查结果中把非裔美国人的回答计算两次。当使用此类的加权方法时,那些已知的人口学因素(比如种族、年龄、性别)就不是太大的问题了。
到底什么因素应该被加权呢?在这点上争议也很大。如果一份调查中民主派人士的占比较小,那么他们的结果应该被加权吗?像这类的决策其实是非常人为的。那这就给了很多民调机构一些操控调查结果的空间了。
电话调查引发了这么多问题,又是低回答率、又是系统性偏差,就连加权也解决不了问题。那如果我们在网上做调查呢?能解决问题吗?
线上调查当然更便宜更快捷,但是线上调查也引发了其他问题:
首先,16%的美国人不用互联网,那么在统计结果时就要考虑到加权。其次,即使搞定了加权,仍有研究发现线上调查的抽样会过度代表男性和失业者。这也解释了为什么特朗普的支持率在线上调查中比电话调查中更高。
以上说的其实都是针对民调中“能不能触及到有代表性的样本”、“能不能随机抽样”的问题,这些问题相对于2016年的总统大选民意调查来说,都算是小问题了。因为2016年,第一次遇到了“选民在调查中不说实话”的问题。
2016总统大选年,几乎所有的民调都显示希拉里会获胜。直到特朗普当上了总统,人们才反应过来,民调中,被调查者不愿意承认自己会给特朗普投票。为什么不愿承认?因为——社会期许偏差(social desirability bias)。
在社会科学中,社会期许误差指的是:人们更倾向于向他人展现正面形象,所以在回答问题时,更倾向于申报“良好行为”来符合社会的期望。
在当主流媒体、明星、还有其他权威人士都公开批判特朗普是一个白人至上主义者、一个潜在的独裁者、一个丑角、一个疯子时,在这样的环境下,人们就不敢对电话对面的陌生人承认自己是特朗普的支持者了。这也就是为什么大选民调的结果都显示特朗普的支持率比希拉里低。
回想四年前的美国总统大选,几乎所有民意调查结果都显示希拉里具有更大的获胜可能性,然而真正的结果却出人意料。这次拜登入住“白宫”如此惊心动魄,从某种意义上来说,民意调查(或者说是社会调查)确实是一件非常复杂且容易“失准”的事情。
更多精彩文章
👇
国内首个MarTech“一体化营销云” 走向成熟 这篇讲产品不讲概念
登陆Convertlab官网
查看更多成功案例,
扫描二维码直接申请,免费试用一体化营销云。
Convertlab一体化营销云DM HUB的实践
大型跨国品牌零售如何利用自动化营销工具实现会员首购10%增长
点击了解我